دسته بندی داده های دورده ای با ابرمستطیل موازی محورهای مختصات

نویسندگان

زهرا مصلحی

zahra moslehi isfahan university of technologyاصفهان- دانشگاه صنعتی اصفهان- آزمایشگاه شناسایی الگو و محاسبات نرم مازیار پالهنگ

maziar palhang isfahan university of technologyاصفهان- دانشگاه صنعتی اصفهان- آزمایشگاه هوش مصنوعی

چکیده

یکی از زمینه های فعالیت در یادگیری ماشین و شناسایی الگو یادگیری با ناظر می باشد. در یادگیری با ناظر برچسب داده های آموزشی موجود است. در مسایل دورده ای، هدف محاسبه فرضیه ای است که بتواند به بهترین شکل ممکن و با کمترین مقدار خطا داده های با دو ردهی مثبت و منفی را از یکدیگر جدا کند. انواع روش های یادگیری با ناظر پیشنهاد شده است. به عنوان مثال می توان به درخت های تصمیم، یادگیر svm و روش های نزدیکترین همسایه اشاره کرد. در این مقاله بر عملکرد درخت های تصمیم متمرکز می شویم. عملکرد درخت تصمیم مشابه پیدا کردن ابرصفحه های تقسیم کننده در فضای d بعدی است، بطوریکه داده های موجود را به درستی رده بندی کند و تا حد ممکن رده بندی صحیح داده های آینده را نیز بدست آورد. دیدگاه هندسی عملکرد درخت تصمیم ما را به مفهوم تفکیک پذیری در هندسه محاسباتی نزدیک می کند. از بین کلیه الگوریتم های تفکیک پذیری موجود، مساله محاسبه مستطیل با حداکثر اختلاف دو رنگ را مطرح می کنیم. این مساله ارتباط نزدیکی با مساله درخت تصمیم در یادگیری ماشین دارد. در ادامه الگوریتم محاسبه مستطیل با حداکثر اختلاف دو رنگ را در یک، دو، سه و d بعد پیاده سازی می کنیم. نتیجه پیاده سازی نشان دهنده آن است که این الگوریتم، الگوریتمی قابل رقابت با الگوریتم شناخته شده c4.5 است.

برای دانلود باید عضویت طلایی داشته باشید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

دسته‌بندی داده‌های دورده‌ای با ابرمستطیل موازی محورهای مختصات

One of the machine learning tasks is supervised learning. In supervised learning we infer a function from labeled training data. The goal of supervised learning algorithms is learning a good hypothesis that minimizes the sum of the errors. A wide range of supervised algorithms is available such as decision tress, SVM, and KNN methods. In this paper we focus on decision tree algorithms. When we ...

متن کامل

ارائه یک الگوریتم خوشه بندی برای داده های دسته ای با ترکیب معیارها

Clustering is one of the main techniques in data mining. Clustering is a process that classifies data set into groups. In clustering, the data in a cluster are the closest to each other and the data in two different clusters have the most difference. Clustering algorithms are divided into two categories according to the type of data: Clustering algorithms for numerical data and clustering algor...

متن کامل

رویکرد شبیه‌سازی در حل مسأله زمان‏بندی ماشین‏ های موازی پردازشگر دسته ‏ای با زمان‏ های احتمالی

در این مقاله، مسأله‏ زمان‏بندی ماشین‏های موازی پردازشگر دسته‏ای با هدف حداقل کردن حداکثر زمان تکمیل کارها بررسی می‌شود. نوآوری این پژوهش، به کارگیری زمان های پردازش و در دسترس بودن کارها به صورت احتمالی است. در تحقیقات پیشین اثبات شده است که مسأله‏ مورد بررسی دارای پیچیدگی سخت است. بنابراین، از روش‏های ابتکاری برای حل مسأله استفاده می‏شود. مسأله مورد مطالعه، دو مرحله تصمیم‌گیری دارد. در مرحله ا...

متن کامل

ارائه یک الگوریتم خوشه بندی برای داده های دسته ای با ترکیب معیارها

خوشه بندی یکی از تکنیک های اصلی داده کاوی است. خوشه بندی فرایندی است که مجموعه داده ها را داخل گروه هایی طبقه بندی می کند. در خوشه بندی داده های موجود در یک خوشه بیشترین شباهت را به هم دارند و داده های موجود در دو خوشه متفاوت بیشترین تفاوت را با هم دارند. الگوریتم های خوشه بندی با توجه به نوع داده ها به دو دسته تقسیم می شوند: الگوریتم های خوشه بندی داده های عددی و الگوریتم های خوشه بندی داده ها...

متن کامل

روشی کارا برای پیاده‌سازی موازی الگوریتم دسته بندی بسته درخت سلسله‌مراتبی بر روی واحد پردازش گرافیکی

چکیده: دسته­بندی بسته­ها، پردازشی اساسی در پردازنده­های شبکه­ای است. در این فرآیند، بسته­ها­ی ورودی از طریق تطبیق با مجموعه­ای از فیلترها به جریان­های مشخص طبقه­بندی می­شوند. پیاده‌سازی‌های نرم‌افزاری الگوریتم­های دسته­بندی با وجود هزینه کم‌تر و توسعه‌پذیری بیش‌تر نسبت به پیاده‌سازی­های سخت‌افزاری، سرعت پایین‌تری دارند. در این مقاله، از قابلیت پردازش موازی پردازنده‌های گرافیکی برای تسریع الگوری...

متن کامل

دسته بندی داده های جریانی فازی با استفاده از تحلیل پوششی داده ها

در این تحقیق یک روش دسته بندی داده های غیرقطعی از نوع فازی که از جمله چالش برانگیزترین حوزه های تحلیل داده محسوب می شود، ارائه شده است. در واقع حجم بالا و پیچیدگی روش های تحلیل داده مانع از توسعه روش هایی جهت تحلیل داده های فازی می شود. با این حال در برخی حوزه های دیگر همچون برنامه ریزی ریاضی پیشرفت های چشمگیری در مدل سازی سیستم هایی که داده های فازی از آنها در اختیار است، بدست آمده است و لذا ت...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید


عنوان ژورنال:
فناوری اطلاعات و ارتباطات ایران

جلد ۷، شماره ۲۵، صفحات ۱-۱۴

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023